עמוד מתוך 4
סטטיסטיקה תיאורית X- תצפית -f( שכיחות מספר פעמים שהתצפית חזרה על עצמה - גודל מדגם -F( שכיחות מצטברת ישנם שני סוגי מיון תצפיות משתנה בדיד סוג תצפית ספציפי.משתנה שכל ערכיו מספרים בודדים. משתנה רציף תחום שלם של תצפיות. משתנה אשר מקבל כל ערך בתוך רווח מספרים. לשני סוגי המיון ישנם גם שני סוגים של הצגה גרפית במשתנה בדיד אנו משתמשים בדיאגרמת מקלות f ( 3 במשתנה רציף אנו משתמשים בהיסטוגרמה ובה יש כמה כללים בגלל שזה משתנה רציף אנו יוצרים מלבנים מגבולות כל קטגוריה במשתנה הרציף בטבלה. אם אין רציפות בין קבוצה לקבוצה אנו יכולים לעשות תיקון רציפות על ידי חיסור וחיבור חצי לכל גבול של כל קטגוריה. משתמשים בשכיחות כציר הY רק כשגודל הקטגוריות שווה. אם גודל הקטגוריות אינו שווה, אנו משתמשים בצפיפות במקום השכיחות בהיסטוגרמה. הנוסחה לצפיפות היא צפיפות שכיחות רוחב מחלקה ההיסטוגרמה צריכה להיראות כך עמוד מתוך 4 3
מדדי פיזור וערכים מרכזיים מדדי הפיזור והערכים המרכזיים עוזרים לנו לדעת יותר ולאפיין יותר את התצפיות שלנו. שכיח הוא התצפית שחוזרת על עצמה הכי הרבה פעמים. יכולים להיות כמה שכיחים. בטבלה מקובצת עם משתנים רציפים, השכיח הוא ממוצע שני הגבולות של הקבוצה בעלת הצפיפות הגבוהה ביותר וגם בטבלה זאת יכולים להיות שני שכיחים. מסמנים את השכיח כMoe. חציון חציון הוא המשתנה שמחצית מהתצפיות קטנות או שוות לא וחצי מהתצפיות גדולות או שוות לו. מסמנים את החציון כMeia. במשתנה בדיד החציון הוא אם הוא מספר זוגי אז אנו לוקחים את התצפית שמספרה הסידורי הוא X אם הוא מספר אי זוגי אז אנו לוקחים את התצפית שמספרה הסידורי הוא בטבלה מקובצת אנו משתמשים בנוסחא הבאה F ( m Me L ( L L f ( m L -הגבול העליון של הקבוצה החציונית - L הכבול התחתון של הקבוצה החציונית m - F השכיחות המצטברת עד לפני הקבוצה החציונית - f ( m השכיחות של הקבוצה החציונית עצמה X תכונות החציון החציון הוא הערך האמצעי של ההתפלגות כלומר הוא נמצא במרכז ההתפלגות. החציון אינו מושפע מערכים קיצוניים של ההתפלגות- אם נקצין יותר בערך המשתנה (נקטין יותר או נגדיל יותר החציון לא ישתנה. ממוצע נוסחת הממוצע i f i X i אם המשתנה הוא רציף אז נבחר באמצע הקטגוריה על מנת לייצג את הקבוצה במקום.X עמוד 3 מתוך 4
תכונות הממוצע הממוצע מתאר ברמה כללית של התכונה הנחקרת. הממוצע מושפע מכל ערכי המשתנה. 3 הממוצע אינו בהכרח אחד מערכי המשתנה. הטווח הבין רבעוני הטווח הבין רבעוני הוא הרווח המתחיל ברבעון התחתון ומסתיים ברבעון העליון. ברווח זה מרוכזות 5% מהתצפיות. לכן, הטווח הבין רבעוני שווה להפרש הרבעון השלישי והרבעון הרביעי. I Q 3 Q על מנת לחשב את הערכים הרבעונים אנו משתמשים בנוסחת החציון ומשנים את מיקומם F( m Q 4 L ( L L f ( 3 F( m Q 4 3 L ( L L f ( m תכונות הטווח הבין רבעוני התחום הבין רבעוני מתאר את הפיזור של מרכז ההתפלגות אך אינו מושפע ממחצית הערכים הנמצאים בקצוות ההתפלגות. התחום הבין רבעוני מושפע מסדר ערכי המשתנה אך לא מהערכים עצמם. m השונות וסטיית התקן אנו מסמנים את סטיית התקן כ. בגלל שסטיית התקן חייבת להיות חיובית, הנוסחה המועדפת לשונות היא i fi i אנו משתמשים בשונות שהיא. גם פה אם המשתנה הוא רציף אז משתמשים באמצע כל קטגוריה בשביל לבטא את X. תכונות השונות השונות וסטיית התקן הן תמיד חיוביות. עמוד 4 מתוך 4
דפי החזרה בסטטיסטיקה הכפלה של כל המשתנים בקבוע תשנה את השונות וסטיית התקן אך הזזה או חיבור של המשתנים לא ישנו. ציון התקן ציון תקן מתאר מיקום יחסי של תצפית בודדת בהתפלגות אליה היא שייכת, בהשוואה לכלל התצפיות של ההתפלגות. Z ציוני תקן הינם מספרים טהורים (ללא יחידות ולכן ניתן לפיהם לזהות מיקום יחסי תצפיות מהתפלגויות שונות ת. טרנספורמציה ליניארי y y אם אנו צריכים לשנות את המשתנים בצורה קבועה של משוואה ליניארית, נוכל גם לחשב באותה דרך את מדדי הפיזור והערכים המרכזיים. אם y a b אז Mo( y a Mo( b M( y a M( b y a b I( y a a I( a עמוד 5 מתוך 4
בדיקת השערות ישנו מצב אשר בו קיימות שתי השערות משלימות אחת באוכלוסיה, ואנו רוצים להחליט איזו השערה לקבל. לשנייה לגבי פרמטר לא יודע -קרויה השערת האפס. -קרויה ההשערה האלטרנטיבית וזוהי בדרך כלל השערת החוקר. בסוג זה של בדיקת השערות מונחות לפנינו שתי השערות בלבד ולכן דחיית אחת מהן היא קבלת השנייה. נחלק את תחום ערכי ההתפלגות לשני חלקים כדי לדעת האם לדחות או לקבל את (לאו דווקא שווים חלק אחד נקרא אזור הדחייה והחלק האחר נקרא אזור הקבלה של K. הנקודה המפרידה בין שני החלקים נקראת נקודה קריטית ומסומנת באות. סוגי הטעויות הסטטיסטיות והסתברותיהן דחיית קבלת נכונה נכונה טעות מסוג ראשון מסוג ראשון P (טעות נקראת רמת מובהקות β עוצמת מבחן טעות מסוג שני מסוג שני P (טעות β הסקה לגבי התוחלת כאשר השונות באוכלוסיה ידועה נתונה אוכלוסיה בעלת התפלגות נורמלית עם ממוצע ושונות ידועה ואנו רוצים להסיק מסקנות על. לשם כך ניקח מדגם בגודל ונחשב את ממוצע המדגם. N ~ ובגלל זה אפשר להשתמש בZ ולבדוק את במקרים אלו תמיד מתקיים הכלל, ערכיו על פי הטבלה של ההתפלגות הנורמלית שנמצאת אחרי נושא זה. רווח סמך ל בבטחון של Z Z ישנם בכל בדיקת השערות שלושה סוגי מבחנים שנקבעים על פי השערת החוקר. דו צדדי מבחן שמאלי מבחן ימני > < > K K Z < K K Z K K K K Z Z עמוד 6 מתוך 4
Pvalue. Pvalue זוהי ה המינימלית עבורה דוחים. כלומר לכל > value דוחים. ולכל value מקבלים במקרה זה של בדיקת השערות לתוחלת כאשר השונות באוכלוסייה ידועה, הנוסחאות הן במבחן ימני במבחן שמאלי value ( z value ( z ובמבחן דו צדדי בודקים האם הממוצע במדגם גדול או קטן מהתוחלת ההתחלתית. אם הוא גדול יותר אז הPvalue גדול פי מהPvalue במבחן ימני. אם הוא קטן יותר אז הPvalue גדול פי מהPvalue במבחן שמאלי. עמוד 7 מתוך 4
טבלת התפלגות נורמלית עמוד 8 מתוך 4
בדיקת השערות כלפי תוחלת באוכלוסייה כאשר השונות באוכלוסייה לא ידועה לצורך מקרה זה נשתמש בהתפלגות t שמתאימה למדגמים. ככל שהמדגם גדול יותר כך ההתפלגות מתקרבת יותר להתפלגות נורמלית. אנו מחליפים כל דבר על מנת להתאים אותו להתפלגותt. לא ידועה ידועה t (, Z t (, רווח בר סמך למקרה זה t (, הדרך לחישוב השונות במדגם היא i ( ובדיקת ההשערות לשלושת המבחנים i Pvalue Pvalue ( t ( t value עמוד 9 מתוך 4
טבלת התפלגות t עמוד מתוך 4
יפד הקיטסיטטסב הרזחה הקיטסיטטס ןמנירג ןואל \ דומע 4 ךותמ, (, ( t t רשאכ םייולת יתלב םימגדמ ינש לש תולחות שרפהל ךמס חוורו תורעשה תקידב תווש לבא תועודי אל היסולכואב תויונושה ךמס חוור.תללקושמ ןקת תייטס - ( ( תורעשה תקידב ידדצ וד ילאמש ןחבמ < ינמי ןחבמ > יפ המ value םיאתמה (.. t v < (.. t v >
בדיקת השערות ורווח סמך להפרש תוחלות במדגמים מזווגים רווח סמך t (, t (, שני המדגמים מבוצעים על אותו אדם או עצם ולכן אנחנו לוקחים את ההפרש - הפרש ממוצע בין שני המדגמים. -שונות ההפרשים. בדיקת השערות דו צדדי מבחן שמאלי מבחן ימני >. v. ( t > <. v. ( t < פי מהvalue המתאים עמוד מתוך 4
מבחני χ מבחני לאי תלות בודק האם יש תלות בין שני משתנים. χ כלל הכרעה χ אם > χ ( r( c, דוחים χ ( o i e e i כאשר i - מספר השורות בטבלה r c - מספר העמודות בטבלה -מה שהתקבל במדגם בפועל e o i - i מה שצפוי להיות e i *לפי הטבלה. במבחני χ תמיד יש אותן השערות אין קשר יש קשר עמוד 3 מתוך 4
הטבלה של התפלגות χ עמוד 4 מתוך 4